气候,化学或天体物理学中的数值模拟在计算上对于高分辨率下的不确定性定量或参数探索而言太昂贵。减少或替代模型的多个数量级更快,但是传统的替代物是僵化或不准确和纯机器学习(ML)基于基于数据的替代物。我们提出了一个混合,灵活的替代模型,该模型利用已知的物理学来模拟大规模动力学,并将学习到难以模拟的项,该术语称为参数化或闭合,并捕获了细界面对大型动力学的影响。利用神经操作员,我们是第一个学习独立于网格的,非本地和灵活的参数化的人。我们的\ textit {多尺度神经操作员}是由多尺度建模的丰富文献进行的,具有准线性运行时复杂性,比最先进的参数化更准确或更灵活,并且在混乱方程的多尺度lorenz96上证明。
translated by 谷歌翻译
全球变暖导致气候极端频率和强度的增加,导致生活巨大损失。准确的远程气候预测允许更多时间进行准备和灾害风险管理,以获得此类极端事件。虽然机器学习方法已经表明了远程气候预测结果,但相关的模型不确定性可能会降低其可靠性。为了解决这个问题,我们提出了一种后期的融合方法,系统地将预测从多种模型中组合以减少融合结果的预期误差。我们还提出了一种具有新型Denormalization层的网络架构,以获得数据标准化的好处,而无需实际归一化数据。远程2M温度预测的实验结果表明,该框架优于30年气候法线,通过增加模型数量可以提高准确性。
translated by 谷歌翻译
ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列,该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战,这是由于探测器的几何形状,不均匀的散射和冰中光的吸收,并且低于100 GEV的光,每个事件产生的信号光子数量相对较少。为了应对这一挑战,可以将ICECUBE事件表示为点云图形,并将图形神经网络(GNN)作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开,对不同的中微子事件类型进行分类,并重建沉积的能量,方向和相互作用顶点。基于仿真,我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术,包括已知系统不确定性的影响。对于中微子事件分类,与当前的IceCube方法相比,GNN以固定的假阳性速率(FPR)提高了信号效率的18%。另外,GNN在固定信号效率下将FPR的降低超过8(低于半百分比)。对于能源,方向和相互作用顶点的重建,与当前最大似然技术相比,分辨率平均提高了13%-20%。当在GPU上运行时,GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件,这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。
translated by 谷歌翻译
可靠,高分辨率气候和天气数据的可用性对于为气候适应和缓解的长期决策提供了重要的意见,并指导对极端事件的快速响应。预测模型受到计算成本的限制,因此通常以粗空间分辨率预测数量。统计降尺度可以提供高采样低分辨率数据的有效方法。在这个领域,经常使用计算机视觉中超分辨率域中的方法成功地应用了深度学习。尽管经常取得令人信服的结果,但这种模型在预测物理变量时通常会违反保护法。为了节省重要的物理量,我们开发的方法可以通过深层缩减模型来确保物理约束,同时还根据传统指标提高其性能。我们介绍了约束网络的两种方法:添加到神经网络末尾的重新归一化层,并连续的方法随着增加的采样因子的增加而扩展。我们使用ERE5重新分析数据显示了我们在不同流行架构和更高采样因子上的方法的适用性。
translated by 谷歌翻译
A deep learning strategy is developed for fast and accurate gas property measurements using flame emission spectroscopy (FES). Particularly, the short-gated fast FES is essential to resolve fast-evolving combustion behaviors. However, as the exposure time for capturing the flame emission spectrum gets shorter, the signal-to-noise ratio (SNR) decreases, and characteristic spectral features indicating the gas properties become relatively weaker. Then, the property estimation based on the short-gated spectrum is difficult and inaccurate. Denoising convolutional neural networks (CNN) can enhance the SNR of the short-gated spectrum. A new CNN architecture including a reversible down- and up-sampling (DU) operator and a loss function based on proper orthogonal decomposition (POD) coefficients is proposed. For training and testing the CNN, flame chemiluminescence spectra were captured from a stable methane-air flat flame using a portable spectrometer (spectral range: 250 - 850 nm, resolution: 0.5 nm) with varied equivalence ratio (0.8 - 1.2), pressure (1 - 10 bar), and exposure time (0.05, 0.2, 0.4, and 2 s). The long exposure (2 s) spectra were used as the ground truth when training the denoising CNN. A kriging model with POD is trained by the long-gated spectra for calibration, and then the prediction of the gas properties taking the denoised short-gated spectrum as the input: The property prediction errors of pressure and equivalence ratio were remarkably lowered in spite of the low SNR attendant with reduced exposure.
translated by 谷歌翻译
框架转移是翻译中的横向现象,导致相应的语言材料对唤起不同帧。预测帧移位的能力使通过注释投影自动创建多语言架构。这里,我们提出了帧移位预测任务,并演示了图表关注网络,与辅助训练相结合,可以学习跨语言帧到帧对应关系并预测帧移位。
translated by 谷歌翻译
联邦学习监督任务的深层学习模型,例如,图像分类和分割,已找到许多应用程序:例如,在人类的循环任务中,如电影后期生产,可以以高效且有效的方式分享人类艺术家的域专业知识。在许多此类应用程序中,我们需要在培训过程中共享由于知识产权或隐私问题而在培训过程中共享时保护培训数据。最近的作品已经证明,当其架构已知时,可以从梯度重建来自图像分类模型的梯度的训练数据。但是,对这种攻击的疗效和失败仍然存在不完整的理论理解。在本文中,我们分析了梯度的训练数据泄漏来源。我们制定培训数据重建的问题,因为为每层迭代地解决优化问题。层面的物理函数主要由来自电流层的权重和梯度与后续层的重建的输出定义,但是它还可能涉及从前面的层的“拉回”约束。当我们通过每层从网络的输出来解决问题时,可以重建训练数据。基于此配方,我们能够将培训数据的潜在泄漏归因于深度网络到其架构。我们还提出了一个指标来测量对基于梯度的攻击对训练数据的深度学习模型的安全水平。
translated by 谷歌翻译
公平是世界各地的文明可以观察到的主要社会价值。这表明这是社会协议,通常用文本描述,例如合同。然而,尽管存在普遍性,但描述了描述社会法案的文本的公平度量仍然存在。为了解决这个问题,我们会返回基于第一个校长的问题来考虑问题。我们利用社会心理学文献而不是使用规则或模板来确定人类在进行公平评估时使用的主要因素。然后,我们尝试将这些单词嵌入式数字化为一个多维句子级公平感知向量,以用作这些公平感知的近似。该方法利用Word Embeddings内的Pro-社会偏见,我们获得F1 = 81.0。基于所述公平逼近向量的PCA和ML使用PCA和M1产生的第二种方法产生86.2的F1得分。我们详细介绍了方法中可以制作的改进,以将句子嵌入到公平性的子空间表示的投影。
translated by 谷歌翻译
在过去的几年中,深层神经网络方法的反向成像问题产生了令人印象深刻的结果。在本文中,我们考虑在跨问题方法中使用生成模型。所考虑的正规派对图像进行了惩罚,这些图像远非生成模型的范围,该模型学会了产生类似于训练数据集的图像。我们命名这个家庭\ textit {生成正规派}。生成常规人的成功取决于生成模型的质量,因此我们提出了一组所需的标准来评估生成模型并指导未来的研究。在我们的数值实验中,我们根据我们所需的标准评估了三种常见的生成模型,自动编码器,变异自动编码器和生成对抗网络。我们还测试了三个不同的生成正规疗法仪,关于脱毛,反卷积和断层扫描的逆问题。我们表明,逆问题的限制解决方案完全位于生成模型的范围内可以给出良好的结果,但是允许与发电机范围的小偏差产生更一致的结果。
translated by 谷歌翻译
目前,由精确的径向速度(RV)观察结果受到恒星活性引入的虚假RV信号的限制。我们表明,诸如线性回归和神经网络之类的机器学习技术可以有效地从RV观测中删除活动信号(由于星形/张图引起的)。先前的工作着重于使用高斯工艺回归等建模技术仔细地过滤活性信号(例如Haywood等人,2014年)。取而代之的是,我们仅使用对光谱线平均形状的更改进行系统地删除活动信号,也没有有关收集观测值的信息。我们对模拟数据(使用SOAP 2.0软件生成; Dumusque等人,2014年生成)和从Harps-N太阳能望远镜(Dumusque等,2015; Phillips等人2015; 2016; Collier训练)培训了机器学习模型。 Cameron等人2019)。我们发现,这些技术可以从模拟数据(将RV散射从82 cm/s提高到3 cm/s)以及从HARPS-N太阳能望远镜中几乎每天进行的600多种真实观察结果来预测和消除恒星活动(将RV散射从82 cm/s提高到3 cm/s)。 (将RV散射从1.753 m/s提高到1.039 m/s,提高了约1.7倍)。将来,这些或类似的技术可能会从太阳系以外的恒星观察中去除活动信号,并最终有助于检测到阳光状恒星周围可居住的区域质量系外行星。
translated by 谷歌翻译